查看原文
其他

解读《大数据白皮书(2020年)》中的数据治理(可下载全文+PPT)

歪老师 数据学堂 2022-11-08

过去的2020年极不平凡,新冠肺炎疫情全球蔓延,经济社会发展形势复杂严峻,各行各业面临着前所未有的挑战,世界正经历百年未有之大变局。然而,危机之中,数字化技术驱动的技术和产业变革仍加速发展,大数据技术、产业和应用逆势而上,数据的作用在助力疫情防控和复工复产中大放异彩,“数据驱动”的价值更加深入人心。


2020年12月18日,由中国信息通信研究院(以下简称“中国信通院”)、中国通信标准化协会、中国互联网协会联合举办的“2020数据资产管理大会”在北京召开,会上发布了《大数据白皮书(2020年)》,该白皮书是继《大数据白皮书(2014年)》《大数据白皮书(2016年)》《大数据白皮书(2018年)》《大数据白皮书(2019年)》之后中国信通院第五次就大数据发布白皮书。(福利:扫描文末二维码加歪老师(data-school)微信好友免费获取所有5本大数据白皮书)


本白皮书在此前四版的基础上,回顾了去年以来大数据各领域的最新进展,梳理了中美英等国数据战略的最新动向,阐述了大数据技术的最新趋势,分析了我国大数据产业、重点领域应用以及数据治理的热点与现状,并对“十四五”期间大数据的发展趋势进行了展望。


相较于《大数据白皮书(2019年)》,2020年的白皮书在第5章节单独介绍了数据治理相关内容,这也说明了数据治理的在目前大数据管理和数据资产管理趋势下的重要性,数据治理不再是虚无缥缈的PPT概念,而是实实在在可以落地执行的IT技术活动,未来将会在企业数字化转型中扮演重要角色。歪老师将会对白皮书中关于数据治理的核心观点进行解读,在解读这部分内容之前,摘录白皮书对数据治理的定义供大家参考理解:从广义的角度,我们认为数据治理是企业、政府、社会、市场等多参与主体,通过技术、制度、人员、法律等多种方式,实现提升数据质量与应用价值、促进数据资源整合与流通共享、保障数据安全等目标的一整套行为体系。


观点1:不同行业的数据资产管理实践模式有所差异目前企业数据资产管理的理论基础主要有三大类:国际数据管理协会(DAMA)的数据管理模型、数据治理研究所(DGI)的数据治理框架、国家标准GB/T36073-2018《数据管理能力成熟度评估模型》(简称DCMM)。不同行业在以上述理论支撑的基础上,根据行业自身特色探索不同的数据资产管理模式,理论的共性逐渐被行业的个性所替代。


金融行业普遍“管理制度先行”,针对性的建立数据质量部门、数据标准部门、数据开发部门、数据分析部门等相关管理部门,数据资产管理活动侧重于监管数据治理、信息系统、数据安全、应急预案。


互联网企业通常“实践探索先行”,将数据模型、数据仓库、数据分析作为核心应用,随着网络数据安全保护能力专项行动的开展和个人信息保护的加强,数据安全也逐渐成为互联网企业的关键数据资产管理活动。


观点2:不同行业的数据资产管理综合能力差距明显DCMM通过数据战略、数据治理、数据架构、数据应用、数据安全、数据质量、数据标准和数据生存周期8个维度对数据资产管理能力进行划分,由低到高分别是初始级、受管理级、稳健级、量化管理级、优化级5个级别。调研发现,金融、电信、互联网等行业的数据资产管理综合能力多处于稳健级和量化管理级,其它行业多数仍处于初始级和受管理级


金融、电信、互联网等行业从业特点本身来说,数据管理起着非常重要的作用,金融领域涉及的数据信息如果出现问题将会导致严重的后果,所以这些行业很早就在数据战略、数据治理、数据架构和数据生存周期等方面开展相关研究实践。


其它行业数据资产管理能力不足的主要原因包括信息化基础薄弱、数据管理投入人员和专业水平不足、数据资产管理驱动力受限等。以工业为例,在信息化基础方面,相较于头部行业成熟的大数据平台和正在建立的数据基础设施,工业企业依然停留在ERP、CRM、SCM等经营管理软件阶段,使得企业级数据采集、存储和分析的成本较高;在数据管理投入人员和专业水平方面,将近一半的工业企业未建立专业的数据管理团队;在数据资产管理驱动力方面,数据多用于监控生产运营和设备故障,数据应用场景狭窄,缺少数据资产带动业务发展的强驱动力。


观点3:政府数据开放共享效果显著相对企业数据来说,政府掌握的信息数据资源占据了整个社会信息资源链条最主要的部分,数据资源规模更大、种类更多,无论是企业还是社会公众,对政府数据资源抱着高度的期待。企业对于政府公开数据需求强烈,对公开各类企业信息、社保数据、教育科研数据的需求分别以42.0%、27.9%、 26.9%的占比位列前三,同时,迫切需求数据跨部门、跨企业、跨行业甚至跨领域流动,政府亟须满足公众效益诉求,实现政府信息资产化、产业化,进而转化成生产力,促进由权益向效益转变。


一方面,政府数据开放共享的制度体系逐步完善。据统计,全国共有30个省份出台了56份政府数据开放的相关政策文件。同时在确定数据共享开放内容、共享开放数据范围、共享开发数据成果形式等3方面进行了一系列实践探索。另一方面,政府数据开放共享的落地实施进展加快。截至2020年4月底,全国已有130个省级、副省级和地级政府上线了数据开放平台,具备包括数据检索、数据申请、数据获取和数据探索等基本能力,形成了省市分级维护数据资源、协同共享数据资源体系的局面。


观点4:数据交易市场建设正在努力探索数据交易平台是数据交易行为的重要载体,可以促进数据资源整合、规范交易行为、降低交易成本、增强数据流动性,成为当前各地促进数据要素流通的主要举措之一。我国的数据交易产业起步于2014年,随着我国大数据元年的到来一同开启,在随后几年,国内大数据交易所呈井喷态势,各地开花。


但从目前的数据交易现状来看,我国大数据交易仍处于起步阶段,突出表现在以下几个方面:一是数据交易主要以单纯的原始数据“粗加工”交易为主,数据预处理、数据模型、数据金融衍生品等的内容的交易尚未大规模展开。二是数据供需不对称使得数据交易难以满足社会有效需求,数据成交率和成交额不高。三是数据开放进程缓慢一定程度上制约了数据交易整体规模,影响数据变现能力。四是数据交易过程中缺乏全国统一的规范体系和必要的法律保障,无法有效破解数据定价、数据确权等难题。


白皮书指出主要原因在于数据交易所的定位和模式未明、数据交易配套的法律痼疾未祛。一方面,各交易所建设时的定位相似、功能重复,在缺少核心竞争优势的同时,服务模式、定价标准等交易规则体系参差混乱,难以培养数据供需双方对交易所的平台依赖,只能沦为小规模数据交易的撮合者。另一方面,数据权属的界定仍处于灰色地带,在相关立法尚未健全的当下,行业内的实践中并未能形成具有共识性或参考性的权属分割规则,产权争议、无法监管的风险令供需双方望而却步。除此之外,频发的数据安全和个人隐私泄露事件加剧了社会对数据交易的不信任感,出于对国家安全、个人信息和商业秘密的保护,主体参与数据交易的主动性、积极性因此降低,成为数据交易所发展的又一大障碍。


观点5:数据安全标准制度体系逐步构建数据安全领域相关的标准规范近年来也在逐步制定并颁布,国家标准GB/T 37988-2019《信息安全技术 数据安全能力成熟度模型》(简称DSMM)已于2020年3月起正式实施。DSMM从数据采集安全、数据传输安全、数据存储安全、数据处理安全、数据交换安全、数据销毁安全六个维度提出了覆盖全生命周期的数据安全能力要求,为各类组织开展数据安全治理提供指引。


工信部于2020年2月印发《工业数据分类分级指南(试行)》,指导工业领城产品和服务全生命周期产生和应用的数据的分类分级工作。同年4月,工信部发布《网络数据安全标准体系建设指南》(征求意见稿),提出了“到2021年,初步建立网络数据安全标准体系”,“到2023年,健全完善网络数据安全标准体系”的标准制度建设目标。中国人民银行于2020年9月发布《金融数据安全 数据安全分级指南》金融行业标准,明确了数据安全定级的要来,规则和定级过程。(福利:扫描文末二维码加歪老师(data-school)微信好友免费获取上述标准文档)


观点6:企业数据安全治理实践逐步深入近年来,全球数据安全事件频发,像瑞典交通局和印度电信等这样的国家政府机构也在不断的受到重创,泄露的用户信息数据量非常惊人,在对于数据的保护与监管、保护与共享等存都在很多矛盾。各国制定和实施相关法律法规需要更多维度的考量,数据安全保护工作面临巨大挑战。在标准制度提供指引和政府监管力度不断增强的背景之下,各行业企业对于数据安全治理的自主意识不断增强,企业级的数据安全治理实践不断深入。


一方面,重视数据安全制度建设成为各类企业共识。实现数据安全治理,需要制度流程、技术手段与组织人员三位一体、高度融合。其中,建立完善的数据安全管理制度是重要基础。在实践过程中,各行业企业纷纷建立起了覆盖“事前预防-事中监控-事后处置”全流程的制度规范体系。


另一方面,数据安全技术应用是保障企业数据安全的重要支撑。在完善制度体系的基础之上,建立完整可靠的数据安全技术体系更是抵御内外部数据安全风险的关键。在传统信息安全涉及的网络安全、主机安全和应用安全的基础之上,覆盖数据采集、存储、挖掘到销毁等全生命周期的技术安全保障更为重要。


关注本公众号(数据学堂,ID:data_school),后台回复“大数据白皮书2020”,即可下载《大数据白皮书(2020年)》和中国信通院官方解读PPT。


(白皮书、部分文字和文中图片来源中国信通院)

<END>



数据学堂


识数据、存数据、管数据、治数据、用数据,就在数据学堂!扫码添加歪老师私人微信(data-school),带你在数据的海洋自由徜徉!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存